iT邦幫忙

2025 iThome 鐵人賽

DAY 2
0

What is Pandas

Pandas是用來創建和操作結構化資料的Python函式庫。什麼是結構化資料?簡單來說就是excel或資料庫中的表格資料。不管是資料讀取、篩選、統計匯整,甚至是在excel中有點難處理的groupby、pivot、樞紐分析表,在Pandas都可以輕鬆完成。

官方網站,了解更多 > https://pandas.pydata.org/docs/

Why Pandas

因為客戶在用。不是。
高效運算:基於Numpy支援向量化運算,效能遠超逐列運算。
高度整合:可無縫銜接Python生態圈的資料分析與機器學習流程。
語法直覺:一行就能篩選出特定資料,與SQL思維接近,入門快。
易於重塑資料:無痛實現橫縱向堆疊/merge/join/melt,還有user最愛的轉置。
支援多種格式:CSV, Excel, JSON, SQL。
資源多:幾乎是資料分析領域的基石,爬文、發問、GPT都so ez。

When Pandas

  1. 需要大量處理結構化資料的工作
  2. 需要將data清理成分析或機器學習可用格式
  3. 需要快速檢視資料分布、找到異常值
  4. 商業報表/財務分析
  5. 工作高度仰賴excel,但excel又不是很強的平凡小社畜

Installation

有vscode的話安裝也是so ez,在vscode terminal pip install

pip install pandas

了解更多 > https://pypi.org/project/pandas/

How to Start

安裝完記得先import才能使用。先來簡單粗暴的讀個csv檔,後面再詳細介紹。

import pandas as pd
csv_data = pd.read_csv('upload0.csv')
print(csv_data)

import pandas as pd 的意思是匯入pandas這個套件,並以pd為別名,所以後面我們呼叫相關的功能時,都會用pd,而不用打全名pandas,譬如範例中的pd.read_csv。pd是Pandas社群慣用的別名,也可以用其他的別名,但是強烈建議就跟著社群大大們走。

https://ithelp.ithome.com.tw/upload/images/20250915/20178631tQu4zGdYUY.png
登愣!是不是很簡單,無痛讀csv!

下集預告

Data Structure
Pandas 提供了兩種類型的資料結構來處理資料

  • Series : 一維資料
  • Data Frame : 二維資料

上一篇
Day0: 緣起及大綱
下一篇
Day2: 初探Data Structure
系列文
從零開始Pandas-外加一點Matplotlib5
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言